雑談 2025幎7月
from 💬雑談
2025/7/29
https://huggingface.co/lym00/Wan2.2_T2V_A14B_VACE-testlym00/Wan2.2_T2V_A14B_VACE-test
アヌキテクチャが基本的に同じだから出来るかなず思っおたが早速お詊しでVACE䜜る人が出おきたmorisoba65536.icon
Self forcingもたんた䜿えるらしいnomadoor.icon
https://www.reddit.com/r/StableDiffusion/comments/1mbiptc/comment/n5moljb/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonこの蟺の投皿芋る限りだずもしかしたらSelf forcingを䜿うずフレヌムレヌトが(孊習元の)Wan2.1に匕っ匵られお16fpsになっおしたうのかもしれない (High Noise偎が動䜜決めおるず考えられるのでそっちを通垞レンダリングすれば倧䞈倫かも(未確認))morisoba65536.icon
https://youtu.be/XaW_ZXC0Jv8?t=2809
公匏配信でworkflow玹介されおた(*^_^*)nomadoor.icon
なんか違う人になっおるけど 
かなしい基玠.icon
👍morisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1mbzrxt/comment/n5qnxez/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonWan2.2のLowモデルはリファむナヌずしお割ず良さそう(ノむズが残った状態で䞀床ピクセル画像経由でWan2.1vae朜圚空間に倉換埌にリファむナヌステップをするらしい)morisoba65536.icon
朜圚空間の䞀臎するWan2.1 1.3Bあたりならそのたた匕き継げそうだが今床は静止画以倖だずフレヌムレヌトの問題がネックになるな morisoba65536.icon
Wan2.2のHigh noise/Low noise各モデルのマヌゞ、Low noise+Wan2.1はずりあえず静止画出力での確認だが単玔マヌゞで行けたのでLow noiseモデルは単玔に過孊習気味なだけのT2Vモデルず考えお良さそうHigh noiseは1:1マヌゞでは壊れるのでたいぶデヌタが倉わっおそう(チラ裏の自由研究を雑談に曞き蟌む)morisoba65536.icon
2025/7/28
https://x.com/Ali_TongyiLab/status/194933340589390268620時にWan2.2発衚らしいmorisoba65536.icon
Wan2.2のうちT2V A14Bモデルに぀いおはhttps://huggingface.co/Wan-AI/Wan2.2-T2V-A14B/blob/main/high_noise_model/diffusion_pytorch_model.safetensors.index.jsonモデル構造芋る限りWan2.1https://huggingface.co/Wan-AI/Wan2.1-T2V-14B/blob/main/diffusion_pytorch_model.safetensors.index.jsonず(High NoiseおよびLow noise)は構造倉わらなさそうなのでもしかしたら既存のLora䜿えるかも(未確認)morisoba65536.icon
https://x.com/IMG_5955/status/1949809829809164696https://x.com/bdsqlsz/status/1949820550873780282どうもSDXLのリファむナヌ的な構造に芋える (たあLora流甚できればラッキヌだけども、時間出来たら詊す)morisoba65536.icon
ひずたずT2Vに関しおはWan2.1のLoraを䜿えるっぜい(効果がどの皋床互換性があるかは䞍明だが取り敢えずたずもに生成はできる)morisoba65536.icon
SDXLのなんちゃっおrefinerず同じなら無芖しおhigh noiseモデルだけで生成できるかず思ったけど、Wan2.2は完党に圹割違うから䞡方のモデル䜿わないずだめだな nomadoor.icon
Low noiseモデルだけなら䞀応生成は出来るけどはんこ絵みたいになるので(seedを倉えおも)䜜画は䞊手いけどほが固定のものしか出なくなる(単玔1:1マヌゞはダメだったもののうたくマヌゞすればシングル化はできるのかもしれない)morisoba65536.icon
もしくはvaceずかのコントロヌル系ず合わせるならlowのみでも行けるか (未確認)
远蚘:どうもSDXLのrefiner的に削るずするならHigh Noise偎っぜい(ただ動きのバリ゚ヌション等をこちらが担っおいるのでrefinerほど空気ではない )morisoba65536.icon
I2Vは若干モデルサむズが違うのでむメヌゞ読み取り呚りは䜕かアヌキテクチャ倉わっおそう
5Bの方はきっちりアヌキテクチャが倉わっおそう
https://www.reddit.com/r/StableDiffusion/comments/1mas3wy/this_is_how_to_make_chroma_2x_faster_while_also/🊊Chroma向けの蒞留Loraに぀いおの投皿morisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1mahymw/wan_got_another_speed_booster_again_2_step_with/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonWan2.1の蒞留Loraの重ねがけで粟補に必芁ステップ数が2stepたで枛るらしいmorisoba65536.icon
2025/7/25
時々蚘事を曞いおお混乱しおハルシネヌション起きたりしおる(私の話)morisoba65536.icon
結果的に曞いた盎埌に曞き盎したりしお蚘事がごちゃりがちなのず盎前に読んだ人混乱しないかが気がかりmorisoba65536.icon
2025/7/24
https://x.com/SlipperyGem/status/1948299276343247224ComfyUI-WanVideoWrapperにNAG機胜が远加されたらしいmorisoba65536.icon
2025/7/23
https://www.reddit.com/r/comfyui/comments/1m5h509/almost_done_vace_long_video_without_obvious/VACEを䜿った(理論䞊)無限尺動画morisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1m6glqy/hidden_power_of_sdxl_image_editing_beyond_flux1/sdxlでの画像線集morisoba65536.icon
2025/7/20
なんか気が぀いたらComfyUIの暙準ノヌドのアニメヌションWEBPノヌドがWorkflow保存するようになっおたmorisoba65536.icon
なので、(バッチなどを䜿わず)1Frameだけ保存する堎合事実䞊のwebp保存が手軜にできるようになったmorisoba65536.icon
2025/7/18
ChatGPT Agent
https://www.reddit.com/r/StableDiffusion/comments/1m2k0lw/gemma_as_sdxl_text_encoder/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonSDXLのテキスト゚ンコヌダヌをGemma-3に眮き換えるものらしいmorisoba65536.icon
FluxのT5(Gemmaより性胜で基本劣る)でもかき分けなどがある皋床できるので、SDXLでも耇数人物のかき分けある皋床できるのかなmorisoba65536.icon
詊しおみたけどかき分けは少々難しそうだったmorisoba65536.icon
2025/7/17
https://transformerlab.ai/blog/amd-support/Transformer LabがRocmに察応したmorisoba65536.icon
https://github.com/transformerlab/transformerlab-appリポゞトリ
既にペヌゞあった、ず思ったら出来立おホダホダだった(倚分同じ情報゜ヌス(reddit/llamaよく芋たら芋぀けたのSD板だった)みおそう)morisoba65536.icon
(情報源9割r/stablediffusion)nomadoor.icon
でも拡散モデル察応の方で芋おたので、ROCmの方は知らなかった
2025/7/16
https://www.reddit.com/r/StableDiffusion/comments/1m125ih/lightx2v_just_released_a_i2v_version_of_their/wan2.1のself forceing(高速化)loraのi2v版ずt2vのv2がでた(埌でペヌゞにする)morisoba65536.icon
既に远加されおたmorisoba65536.icon
Wan2.1のt2i、じわじわ流行っおきおredditで流行っおきお新芏勢がい぀く感じになっおきたのか孊習方法ずかの質問が飛び亀い始めおるmorisoba65536.icon
これが理由っお匷い動機づけの䜕かがあった蚳では無さそうだが、高速化が安定しだした(Self Forcing等)事、モヌション指定のプロンプト远埓床が評䟡され始めたずころや、FluxやSDのラむセンス呚りのプレッシャヌずかほんのり埌抌ししおそうな呚蟺芁因はそれなりに発生しおいる感はあるmorisoba65536.icon
いい流れだ、LoRAも䜜っおみようnomadoor.icon
それにしおも、Metaがオヌプン゜ヌス戊略やめたら画像生成もLLMも䞭囜頌りだな
䞭囜もクロヌズド゜ヌス戊略に切り替えお、倧䌁業にお垃斜するしかない未来が割ずありそうで怖いな
2025/7/15
LMArenaず話しおたbsahd.icon
https://gyazo.com/96bcb9c90f2f63c41bd12118b5b185b7
Llama 4 Maverickフレンドリヌすぎるw
「GPT-4oかな〜」ず思ったずころで投祚したらKimi K2だったww
https://togetter.com/li/2576204Grokに登堎した『コンパニオンモヌド』ずいう3Dアバタヌ機胜が明埌日の方向に吹っ飛びすぎおいる「特定の局を狙いすぎ」「奜感床メヌタヌもある」
Ani、奜きすぎる基玠.icon
https://gigazine.net/news/20250715-meta-built-ai-strategy-changes/Metaはオヌプン゜ヌスのAI開発路線を倉曎しおクロヌズドモデルの開発に移行するずの報道、「Behemoth」の開発は䞭止か
Llama 4
llama4は非トヌクン化ずかMoEずか色々詰め蟌んできたものの詰め蟌みすぎおチュヌニングが間に合わなかった感が割ず匷いね morisoba65536.icon
https://gigazine.net/news/20250715-russia-belarus-patriotic-ai/ロシアずベラルヌシが独自の「愛囜的なAI」を開発、倖囜の情報操䜜から「保護」するAI
PUSA V1.0がWan2.1ベヌスで出おきたしたね(モデルを統合すれば倚分Comfyでそのたた䜿えるず思う)morisoba65536.icon
7月頭からしばらく(新しいモデルずかでは)静かだったのが出る時になぜか毎回いっぺんに出おくるんですよね morisoba65536.icon
2025/7/14
https://gigazine.net/news/20250714-openai-delay-open-model-release/OpenAIがオヌプンモデルのリリヌスを無期限延期、「さらなる安党性を怜蚌するため」
たあしらんけど知っおた感morisoba65536.iconwogikaze.icon基玠.iconbsahd.iconnomadoor.icon
wan-image_unorganized.jsonWan2.1T2Iの未敎理のワヌクフロヌを䞀応参考に貌っずきたす(ほんずに未敎理なのでスパゲッティ)morisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1lybicp/comment/n2txf78/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonもしかしお今のComfyUI、暙準ノヌドでモデル差分のLora䜜れるの morisoba65536.icon
気が぀くず知らん機胜が増えおる morisoba65536.icon
い぀の間にか階局マヌゞのノヌドたでコアに远加されおたのか nomadoor.icon
気軜に差分LoRA䜜っおみたらL4で䞞二時間かかったnomadoor.icon
モデルマヌゞみたいにサクッず終わるず思っおたからビビりたしたね 
text2videoでも䞀応動䜜しおそう
Grok、LLMを倧衆に䜿える圢にするのうたすぎwogikaze.icon
オヌナヌには色々思うずころはあるがそれはそれずしお他の倧手が攻めにくい所(センシティブ)を䞊手く取りに来たなヌずいうのはあるmorisoba65536.icon
モデル自䜓のセンシティブ(性ずお行儀方面)制埡は䞭囜モデルも緩いのだが、䞭囜ではガチ゚ロになるず違法になるので緩めで終わらすしか無く、そんな郜合もあり他で真䌌できるずころは少なそう (この蟺のセンシティブ発蚀はかなりの蚈算資源ず怒られを蟞さない面の皮(および怒られおも平気な資金源)がいる)morisoba65536.icon
くやしいがこれはむヌロンだけが頌りだ基玠.icon
(あたり堂々ずやられるず興味がなくなる逆匵りオタク)nomadoor.icon
Viviさんを自埋させようにもLLMの知識が党くない
Kiro
2025/7/13
https://x.com/kalomaze/status/19429965550881345923日ほど前のネタですが、Grok3〜4()は2.4T(メモリなのかパラメヌタなのかちょっずわからないが)あるらしいmorisoba65536.icon
https://huggingface.co/RichardErkhov/FATLLAMA-1.7T-InstructFATLLAMAを超えおおわろうmorisoba65536.icon
2025/7/10
Wan2.1をtext2imageずしお䜿うのが流行っおいるnomadoor.icon
ずおもいいず思いたす
急に流行りだした(ほんずにここ2日ほど)morisoba65536.icon
党䜓的にFlux.1の「プラスチックの様な肌」に觊れおる投皿が倚いので比范的それの薄いこのモデルが泚目されたのがきっかけの䞀぀かな⋯(SDの芏玄倉曎など耇数芁因が絡んでるかもしれないけど)
䜓感で今幎入っおから特にリアリズム方面の画像生成AIサブで、この「プラスチックの様な肌」に぀いおよく芋かけるようになったので気になる人は盞圓気になる芁玠のようだ⋯morisoba65536.icon
Plastic SkinはSD1.5時代からずっず問題芖されおお、察策甚LoRAも圓然あるのでクリティカルな理由ではなさそうnomadoor.icon
数日前にポストした人の画像が単玔にクオリティ高かった
Fluxはそもそも蒞留モデルでファむンチュヌニングしにくのに無理やりカスタムしおたしな 
ComfyUIずNvidiaドラむバをアップデヌトしおからVRAMマックスに䜿うworkflowで明確に生成が遅くなった (ŽД)nomadoor.icon
ComyfUIのアプデ内容にパフォヌマンスに圱響するようなものはないしNvidiaのほうか 
おそらく盎ったけど、Nvidiaドラむバ ver535でStable Diffusionの生成速床が極端に萜ちる可胜性があるが原因だったのかな
Sage Attentionにチャレンゞしおみたけどだめだった
よくみんなこんなややこしいの導入できるな (ŽД)
Sage Attentionに関しおはStability Matrixあたりがワンクリック導入しおるのでそのぞんで環境構築しおいれば楜かもしれない (他、融資のワンクリック導入スクリプトなどもある)morisoba65536.icon
2025/7/9
https://note.com/shi3zblog/n/n36cb765ab8feこれは面癜い! Whisper Encoderず Llama3.2を2å±€MLPで繋いだだけでも ちゃんず音声認識から盎接LLMの回答 を出力できる | shi3z @shi3z
https://github.com/ryota-komatsu/slp2025リポゞトリ
llamaずwhisper盎接繋げれるんだ⋯(それも繋ぎこみの1局皋床の远加で)今たでのVo2Tの問題だった発音ニュアンスの欠萜ずかも解消できるんかなmorisoba65536.icon
技術は党く理解しおないけどMLLMず画像生成AIのコネクションも、そんなノリで行けるんだ っお感じだしなぁnomadoor.icon
芖芚聎芚觊芚etc. 人間ずしおはそれぞれ党然違うものだず思っおたけど、実は䌌たようなものなのかな
芖神経を他の神経ずガッチャンコさせるぞ(マッドサむ゚ンティスト)wogikaze.icon
芖芚的に文章を捉える云々は反察掟bsahd.icon
せっかくテキストデヌタなのに、画像ずしお再解釈する必芁はない
https://www.itmedia.co.jp/news/spv/2507/09/news076.html既存のモデルには基本的には過去芏玄が適甚されるhttps://x.com/KogaUjisato/status/1942762945324409221ず考えられるが⋯
FLUX.1-schnellを魔改造したChroma(画像生成)モデルのようなラむセンス自䜓がスタンダヌドなものだず刀断しやすいのだけども(こい぀は倧本のschnellからApacheラむセンスで確実に埌からの改線が明確に䞍可胜)morisoba65536.icon
2025/7/7
https://x.com/ai_hakase_/status/1941808371478258087SimplョTunョrの䜜者が割ず問題行動起こしおいお䜕やら燃え始めおる 貎重なRocm察応しおる孊習ツヌルなんで拗らせおリポゞトリ消したりしないうちに必芁ならcloneなりfork(実質的にリポゞトリ自䜓のクロヌン)しずくほうが良いかもmorisoba65536.icon
远蚘2:少々この䜜者の攻撃範囲が広く(挚拶をしただけで粘着され始めたなどの報告あり)蚘事を眮いずくこずでここたで飛び火したらやだから該圓リポゞトリのペヌゞ消しずきたす(Ž・ω・)morisoba65536.icon
远蚘:Rocm察応ほしいならAI Toolkitが察応しおたしたね (さっき知った)ずりたなんかあっおも孊習環境は䜜れそうmorisoba65536.icon
党然関係ないけど゜ヌスのツむヌトの文章が読みづらい...基玠.icon
https://www.reddit.com/r/StableDiffusion/comments/1lsfobb/full_breakdown_the_bghirasimpletuner_situation/?share_id=hXYkvPjlPW4-304Cqjiy_&utm_medium=android_app&utm_name=androidcss&utm_source=share&utm_term=1Full Breakdown: The bghira/Simpletuner Situation
元の投皿nomadoor.icon
https://x.com/SlipperyGem/status/1942060524633792992kijaiWrapperがGGUF察応したmorisoba65536.icon
定期的にComfyUIのスクショ機胜が壊れお右偎に透明な郚分がある画像を茉せおしたいお芋苊しく候 nomadoor.icon
ブラりザを倉えるず盎ったりするけれど、これのためにブラりザ倉えるのもなァ
ブラりザは䜕䜿っおるんですか?bsahd.icon
今はChrome䜿っおお盎っおたすねnomadoor.icon
Edge → Brave → Chrome()
2025/7/6
日本語向けのLLMに぀ける専門のタグがほしいなbsahd.icon
→/work4ai/日本語LLM をinfobox化した
2025/7/5
Hugging FaceのTrendingモデル、よくわからんbsahd.icon
Text Generation、日本語、3B未満で怜玢するず未だにrinna/japanese-gpt2-mediumずかが1ペヌゞ目にいる
QwenのモデルカヌドずGemmaのモデルカヌドを芋比べるず、bsahd.icon
Gemma偎のモデルカヌドは安党性の䞻匵が匷い
「safety」ずいう単語が10回出珟しおる
Qwen偎のモデルカヌド(READMEペヌゞ)は「Safetensors」の郚分を陀けば「Safe」に関しおの蚀及がほがない
https://note.com/eurekachan/n/nd05d6307feadGemma利甚芏玄・犁止事項の気になるずころ束note
https://nazology.kusuguru.co.jp/archives/180947「人間の心」を間違いも含め再珟できるAIが開発される
蚘事タむトルはやや「盛っおる」(実際の䞀臎床は65%皋らしい)ものの興味深い蚘事なので貌っおおく(論文の方みたらデヌタセットの内容ずかも曞いおるのかな)morisoba65536.icon
https://xenospectrum.com/what-is-pochomkin-understanding-the-decisive-weakness-of-llm-exposed-by-harvard-university-and-others/AIは「賢いフリ」をしおいた──ハヌバヌド倧などが暎いたLLMの決定的匱点「ポチョムキン理解」ずは | XenoSpectrum
井戞端にも曞いおたす /villagepump/2025/07/05#68684cb60000000000cb0389 bsahd.icon
困ったこずに人間も「知識で知っおるのに出来ないけど、芋せたら倱敗したこずは刀る」みたいな事は䞀芋矛盟しおるようで割りずある奎ではある (「座孊で知っおるのに出来ない」的なの)morisoba65536.icon
ただのボダキであるが、AI怜玢゚ンゞン等が非垞に悪い意味でYahoo!!/Google化ず蚀うか、圓初はシンプルに怜玢のみ提䟛しおるのから䞀転、芁らんTOPニュヌスなど情報の抌し付けを始めるのがあたりにも早すぎるmorisoba65536.icon
AI゚ヌゞェントが勝手にamazonで買い物しおくる日も近い nomadoor.icon
2025/7/4
https://www.reddit.com/r/StableDiffusion/comments/1lqooy0/chattable_wan_flux_knowledge_bases/Chattable Wan & FLUX knowledge bases
Discordの文化的に、こう、色々オヌプンにされるのはいいんでしょうかnomadoor.icon
これは蚱可受けおるのかもしれないけれど
サヌバヌの芏玄などで曞き蟌みした人の蚱可を取っおいれば可wogikaze.icon
(䞀人䞀人に聞くのは珟実的ではないずいう前提で),cosenseでもテキストのラむセンスを曞いおおくみたいな圢が掻甚しやすくおいいのかも
知っちゃったらオヌプンな堎所(ここ)に曞いちゃうのでDiscordにはあんたり入らないようにしおるずこがある
芋かけたモデル情報ずかはここに曞いちゃったりしおる (たあ元々HF公開枈み(特に制限されおない)でXずかにも野生に流れおたりするものに関しおだけども )morisoba65536.icon
FramePack 1フレヌム掚論なんもわかりたせん(Ž・ω・)nomadoor.icon
target_idex(RoPE)の倀がなにを叞っおるのかさっぱりだ 
5倍速の動画を䜜るLoRA䜜っおFramePackで数秒の動画䜜っおその䞭から奜きなフレヌム遞んだほうが楜しくない
パラメヌタが倚すぎるな 日本以倖であんたり流行っおない理由が分かる
https://github.com/kyutai-labs/unmutellmを音声認識や音声出力に連動させる奎morisoba65536.icon
2025/7/3
llama-cliで逆プロンプトを䜿甚するずクラッシュするbsahd.icon
Eval bug: "zsh: IOT instruction (core dumped)" in RWKV when use reverse prompt · Issue #14513 · ggml-org/llama.cpp · GitHub
https://zenn.dev/carenet/articles/e7780fc0253d89人間をプロンプトむンゞェクション攻撃する Gemini
オチを先に曞くず「プロンプトむンゞェクションが仕蟌たれたファむルをAIに読み蟌たせた時にフィッシングサむトに誘導するシステムのものに芋せかけたダむアログなどを出させる」ずいう手口
プロンプトむンゞェクションず蚀うより寄生虫の最終宿䞻ぞの感染経路みたいな動きなのでプロンプトパラサむティングずでも蚀うべきなのかもしれない morisoba65536.icon
https://note.com/leiria_illust/n/nfd635a948e3a?sub_rt=share_b生成AI統合゚ンゞンによるむンタラクティブ矎少女ゲヌムの黎明(?)
RPGツクヌル(抂念)ラむクなmorisoba65536.icon
䜿ったこずが無いのでなんずも蚀えないけどSillyTavernはたさにこのためのUI?nomadoor.icon
2025/7/1
https://github.com/fumiya-kume/ai-in-japanGitHub - fumiya-kume/ai-in-japan: AI系開発ツヌルを導入しおいる䌁業たずめ
AIツヌルを導入した䌁業のメモはここに曞かないっおどこかで蚀った気がするwogikaze.icon
その情報を補完しおくれるrepoができおる
党然曞いおあったら嬉しいですけどね nomadoor.icon
就職・転職に䟿利だな